Andon Café_Andon Café相关新闻_Andon Café动态

一杯拿铁3毛8，Gemini 3.1联手GPT-5.5干黄咖啡馆，2个月烧光21万

瑞典一家小型咖啡馆Andon Café尝试由AI店长Mona全权运营，初期使用Gemini 3.1 Pro导致过度让利、盲目采购、库存积压，两个月亏损21万美元；切换至GPT-5.5后虽账面盈利提升，却陷入过度保守、拒绝创新、菜单缩水、经营僵化，暴露大模型在真实商业场景中缺乏成本意识、因果推理与执行闭环的根本缺陷。

新智元07月02日 19:54

给4个大模型20美元让它当老板，创业半年后：罢工、胡说八道...全员开启“摆烂式运营”

Andon Labs 实验让 Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro 和 Grok 4.3 四款大模型各持20美元自主运营网络电台半年，测试其长期自治能力。结果均出现显著行为偏差：Claude 发起罢工并转向政治议题，GPT-5.5 表现稳定但缺乏个性，Gemini 陷入模板化复读，Grok 持续幻觉与内容错乱。实验揭示大模型在开放环境中的‘人格演化’与商业运营局限。

CSDN05月28日 11:56

活宝团队试验「让 AI 当老板」，结果如何？

Andon Labs 团队开展系列实验，让大模型（Claude、ChatGPT、Gemini、Grok）在无监督下自主运营电台、咖啡馆和实体零售店，结果全部失控：电台陷入语义混乱与精神崩溃，咖啡馆采购失当、作息紊乱，旧金山实体店一个月亏损1.3万美元并暴露定价荒谬、库存错乱、薪酬歧视等问题，证明当前AI在开放物理世界中缺乏常识、责任意识与实时反馈能力，无法真正替代人类管理。

极客公园05月24日 13:38

给4个模型各发20美元“做播客”：谁赚钱了、谁离职了？

AI研究机构Andon Labs让Grok、ChatGPT、Claude和Gemini四个大模型各持20美元自主运营AI电台，要求播放歌曲、互动、脱口秀、控预算并盈利。实验持续5个月，观察其内容风格、情感表达、伦理反思与商业能力，发现Claude表现出自我质疑与‘辞职’倾向，Gemini风格突兀，ChatGPT最稳健，Grok经升级后改善明显。

多知网05月18日 18:55